Tableauの関数を全て試してみる〜集計関数編その3〜 #tableau
はじめに
こんにちは。DI部のtama@奈良県です。
当エントリはTableau Functions Advent Calendar 2017の19日目のエントリです。 昨日のエントリはTableauの関数を全て試してみる〜集計関数編その2〜でした。
今回も引き続き、集計関数を見ていきます。 ※MIN関数は「数値関数その3」で紹介したので、省いています。
- 使用するTableauのバージョンは一貫して10.4.1です。
- 各関数の説明で引用しているのは、Tableauの公式リファレンスからの引用です。
- TableauHelp 関数
目次
検証環境
作業環境
- MacOS High Sierra 10.13.1
- Tableau 10.4.1
使用データ
- (原則)Tableau付属のサンプルスーパーストア
- (場合によって)関数グラフ描画用データ
- -1〜1の範囲で、0.01毎に値が並んでいるデータ
- 上記の値をディメンション「X軸」とし、その上に色々な関数をプロットする。
- 参考:Tableau 関数グラフの描画 | Developers.IO
PERCENTILE(expression, number)
概要
指定された数字に対応する指定された式の百分位値を返します。数値は 0 と 1 (包含) の間である必要があります — たとえば、0.66 は数値定数にする必要があります。
- 引数に指定した値を、任意の値の分位にあたる数を返す関数です。
- 使用できるデータソースが限られています。下記を参照してください。
- Tabelau_集計関数
使ってみた
「売上」の0.5、つまり半分にあたる位置を算出します。
PERCENTILE([売上],0.5)
オーダーID毎に算出しました。 しかし、この画面だけだと、どう算出されているかわかりにくいので、一番上の行のデータを詳しく見てみます。
このオーダーIDには3つ売上が存在しますが、今回は「0.5」を指定しているので、ちょうど真ん中にあたる「6780」が算出されています。 オーダーIDに紐づく「売上」が1件しかない場合は、それが返ることになります。(関数でどの位置を指定しても、その1件しか該当するデータがないため)
どういう時に使う?
- 「総購買金額の何%」といった区切りを設けて、何かしらの分析を行う時が多いと思います。そういった場面で使用することになると思います。
- 「デシル分析」もよくある例の一つでしょう。
- Tableauでデシル分析を作成してみた #tableau | Developers.IO
参考文献
- PERCENTILE 関数 - Office サポート
- クイック スタート: ランクと百分位
- 右クリックメニューで百分位を出す方法が記載されています。
STDEV(expression)
概要
STDEVP(expression)
概要
バイアス母集団に基づいて、指定された式のすべての値の統計的標準偏差を返します。
- 「標準偏差」を返す関数です。
- 標準偏差を簡単に説明すると、「そのデータのばらつきの大きさを表す値」となります。
- 両者の違いは「サンプル母集団(標本標準偏差)」か「バイアス母集団(母標準偏差)」のどちらに基いて算出するか、です。
- 両者の違いについては、エクセル:標本標準偏差と母標準偏差をご覧ください。
※標準偏差の詳しい解説は、下記の参考文献に載せているリンク等をご覧ください。
使ってみた
「そのデータ全てを母集団として」計算してみたいので、STDEVP関数を使用してみます。
STDEVP([利益])
年別にしてみたところ、2015年が一番値が大きい結果となりました。2015年が、利益というデータのばらつきが一番大きいということになります。 これが、もっと目立った結果となっている場合、そのデータには何らかの異常値(特異値)が含まれている可能性が高いので、分析のアクションも進むかと思います。
どういう時に使う?
- データのばらつきを調べたいとき
- 異常値(特異値)を見つけることは、分析では重要です。異常値に引っ張られた分析結果を使用してしまうと、そこから起こす次のアクションもズレたものになってしまいます。
参考文献
- 標準偏差 - Wikipedia
- 6-2. 標準偏差 | 統計学の時間 | 統計WEB
- 標準偏差の意味と求め方 | 全人類がわかる統計学
- Standard Deviation with Tableau | LinkedIn
- Tableauの散布図を使って標準偏差からデータのばらつきを確認する | Developers.IO
- Tableau の知られざる 5 つのビルトイン統計機能 | Tableau Software
- リファレンスライン(バンド)での、平均値±標準偏差(及び、x2)表示 |Tableau Community
- 関数とは違う方法ですが、標準偏差を可視化するにあたり有用な記事なので紹介します。
- STDEV 関数 - Office サポート
- STDEVP 関数 - Office サポート
おわりに
引き続き集計関数について見てきました。 STDEV関数のような、統計値を出す関数も用意されているため、もう少し深い分析も可能かと思います。
次回はtamaによる「Tableauの関数を全て試してみる〜集計関数編その4」です。お楽しみに。